量子位
04-10 18:02
大模型能“原地”改参数了!字节Seed&北大新论文:测试时推理无需加层重训练
📌 一句话:字节跳动与北大联合发布突破性技术,让大模型在推理过程中直接修改自身参数,无需重训练或添加新层。
💡 3个要点
字节Seed团队与北大联合提出Test-Time Workshop方法,实现推理时参数更新
打破传统"训练后参数固定"模式,大幅降低计算成本和适配门槛
可在推理过程中动态适应不同任务,尤其擅长处理分布外难题
📖 背景
大语言模型传统上依赖预训练+微调的两阶段范式,参数在训练后固定,适配新任务成本高。
💭 点评
这不仅是技术优化,更是对"模型参数不可变"这一基本假设的挑战。想象一下,如果模型能像人一样边思考边调整认知方式,那AGI或许不再遥远。当然,安全性如何保障、实际部署效果如何,还需观察。但有一点可以确定:AI正在从"学完就用"向"边用边学"进化。
📖 原文链接
点击阅读原文 →